式子|极值_机器学习算法笔记4.支持向量机（SVM）

作者：手机用户2502869023 | 来源：互联网 | 2023-09-24 16:13

篇首语：本文由编程笔记#小编为大家整理，主要介绍了机器学习算法笔记4.支持向量机（SVM）相关的知识，希望对你有一定的参考价值。

篇首语：本文由编程笔记#小编为大家整理，主要介绍了机器学习算法笔记4. 支持向量机（SVM）相关的知识，希望对你有一定的参考价值。

【机器学习算法笔记】4. 支持向量机&＃xff08;SVM&＃xff09;
给定训练样本&＃xff0c;支持向量机建立一个超平面作为决策曲面&＃xff0c;使得正例和反例之间的隔离边缘最大化

4.1 线性模型

考虑到用于分离超平面的决策曲面&＃xff1a;

x到超平面的距离&＃xff1a;

现在我们考虑到要寻找一个超平面&＃xff0c;使得全体x到超平面的距离都大于1&＃xff1a;&＃xff08;这里d&＃61;1或-1&＃xff09;

&＃xff08;这里可以看出&＃xff0c;d取1或-1和d取2或-2是一样&＃xff0c;在是用于分割超平面的两半&＃xff09;
并且满足权值向量最小化代价函数&＃xff1a;

建立拉格朗日函数&＃xff08;这里也可以看出d的值不会影响函数&＃xff09;&＃xff1a;

得到&＃xff1a;

可以变为&＃xff1a;

计算出

4.2 不可分模式的最优超平面

上面情况是一个不具有分类误差的分离超平面&＃xff0c;我更希望找到一个最优平面&＃xff0c;使香分类平均误差最小&＃xff0c;这样的分类边缘称为软的。
我们将分类距离定义为&＃xff1a;

最小化代价函数可简化为&＃xff1a;

这里的参数C用于控制不可分离点数之间的平衡&＃xff0c;当C比较大的时&＃xff0c;暗示训练样本质量较高&＃xff0c;而当C较小时&＃xff0c;说明其存在噪声
所以不可分离情况与可分离情况&＃xff0c;主要是在&＃xff1a;

支持向量的个数反映了隐藏空间特征的个数。

4.3 SVM的数学解释

SVM有两个方向去看待这个问题&＃xff0c;第一个是从拉格朗日方向&＃xff08;也就是前面&＃xff09;&＃xff0c;第二个方向是直接从目标函数&＃xff08;损失项和正则项角度去看&＃xff09;
一般来说&＃xff0c;监督学习可以看做最小化下面的目标函数&＃xff1a;

逻辑回归中Logistic regression中损失函数称为log loss&＃xff1b;
而SVM中的称为hinge loss。
这个方向上考虑SVM&＃xff0c;虽然在式子相似&＃xff0c;但在理论上是不同的&＃xff0c;前者这里的那项C&＃xff0c;这是在软间隔中引入的&＃xff0c;即在不能线性可分的情况下&＃xff0c;允许离群点存在。此时你希望分错的距离越少越好&＃xff0c;就增大C&＃xff0c;相当于提升了加号后式子的权重&＃xff0c;减弱了加号前式子的权重&＃xff0c;从而学出来的模型分错的点的距离会小&＃xff0c;当C无穷大时&＃xff0c;相当于没有错分的&＃xff0c;也就是硬间隔。而后者的项C是加在正则项上的。

4.4 核方法支持向量机

超平面被写成如下形式&＃xff1a;

此时&＃xff1a;

4.5 SMO算法求解

首先回到我们前面一直悬而未解的问题&＃xff0c;对偶函数最后的优化问题&＃xff0c;这个问题可以由SMO算法来快速解决&＃xff0c;SMO算法是最快的二次规划优化算法&＃xff0c;特别针对线性SVM和数据稀疏时性能更优。

按照坐标上升的思路&＃xff0c;我们首先固定除α1以外的所有参数&＃xff0c;然后在α1上求极值。等一下&＃xff0c;这个思路有问题&＃xff0c;因为如果固定α1以外的所有参数&＃xff0c;那么α1将不再是变量&＃xff08;可以由其他值推出&＃xff09;&＃xff0c;因为问题中规定了

因此&＃xff0c;我们需要一次选取两个参数做优化&＃xff0c;比如α1和α2&＃xff0c;此时α2可以由α1和其他参数表示出来。这样回带到W中&＃xff0c;W就只是关于α1的函数了&＃xff0c;可解。
这样&＃xff0c;SMO的主要步骤如下&＃xff1a;

意思是&＃xff0c;第一步选取一对αi和αj&＃xff0c;选取方法使用启发式方法。
第二步&＃xff0c;固定除αi和αj之外的其他参数&＃xff0c;确定W极值条件下的αi&＃xff0c;αj由αi表示。

4.6 RBF的SVM

径向基网络的支持向量机结构&＃xff1a;

对于径向基网络的支持向量机来说&＃xff0c;其径向基函数的数目和中心分别由支持向量的个数和值来决定&＃xff0c;其特别是&＃xff1a;
1、有意使特征&＃xff08;隐藏&＃xff09;空间的维数足够大&＃xff0c;使得可以在整个空间建立超平面
2、通过聚类方法找到中心。

4.7 SVM的核函数

支持向量机是建立在统计学习理论基础之上的新一代机器学习算法&＃xff0c;支持向量机的优势主要体现在解决线性不可分问题&＃xff0c;它通过引入核函数&＃xff0c;巧妙地解决了在高维空间中的内积运算&＃xff0c;从而很好地解决了非线性分类问题。
构造出一个具有良好性能的SVM&＃xff0c;核函数的选择是关键&＃xff0e;核函数的选择包括两部分工作&＃xff1a;一是核函数类型的选择&＃xff0c;二是确定核函数类型后相关参数的选择&＃xff0e;因此如何根据具体的数据选择恰当的核函数是SVM应用领域遇到的一个重大难题&＃xff0c;也成为科研工作者所关注的焦点&＃xff0c;即便如此&＃xff0c;却依然没有得到具体的理论或方法来指导核函数的选取&＃xff0e;

1、经常使用的核函数

核函数的定义并不困难&＃xff0c;根据泛函的有关理论&＃xff0c;只要一种函数 K ( x i , x j ) 满足Mercer条件&＃xff0c;它就对应某一变换空间的内积&＃xff0e;对于判断哪些函数是核函数到目前为止也取得了重要的突破&＃xff0c;得到Mercer定理和以下常用的核函数类型&＃xff1a;
(1)线性核函数

(2)多项式核

(3)径向基核&＃xff08;RBF&＃xff09;

Gauss径向基函数则是局部性强的核函数&＃xff0c;其外推能力随着参数 σ 的增大而减弱。多项式形式的核函数具有良好的全局性质。局部性较差。
(4)小波核

(5)样条核

(6)Sigmoid核函数

采用Sigmoid函数作为核函数时&＃xff0c;支持向量机实现的就是一种多层感知器神经网络&＃xff0c;应用SVM方法&＃xff0c;隐含层节点数目(它确定神经网络的结构)、隐含层节点对输入节点的权值都是在设计(训练)的过程中自动确定的。而且支持向量机的理论基础决定了它最终求得的是全局最优值而不是局部最小值&＃xff0c;也保证了它对于未知样本的良好泛化能力而不会出现过学习现象。

2、核函数的选择

在选取核函数解决实际问题时&＃xff0c;通常采用的方法有&＃xff1a;一是利用专家的先验知识预先选定核函数&＃xff1b;二是采用Cross-Validation交叉验证方法&＃xff0c;即在进行核函数选取时&＃xff0c;分别试用不同的核函数&＃xff0c;归纳误差最小的核函数就是最好的核函数。三是混合核函数方法&＃xff0c;该方法较之前两者是目前选取核函数的主流方法&＃xff0c;主要是将不同的核函数结合起来后会产生更好的特性。

关于核函数的一些参考&＃xff1a;
http://blog.csdn.net/wsj998689aa/article/details/47027365
http://blog.csdn.net/batuwuhanpei/article/details/52354822

推荐阅读

java
Python3爬虫入门：pyspider的基本使用[python爬虫入门]

Python学习网有大量免费的Python入门教程，欢迎大家来学习。本文主要通过爬取去哪儿网的旅游攻略来给大家介绍pyspid ... [详细]

蜡笔小新 2024-11-22 18:00:41
java
解决Android Studio意外崩溃及重启后Import错误问题

本文提供了一种有效的方法来解决当Android Studio因电脑意外重启而导致的所有import语句出现错误的问题。通过清除缓存和重建项目结构，可以快速恢复开发环境。 ... [详细]

蜡笔小新 2024-11-22 11:53:00
io
计算机学报精选论文概览（2020-2022）

本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文，旨在为即将投稿的研究者提供参考。 ... [详细]

蜡笔小新 2024-11-20 11:08:21
controller
Spring Security基础配置详解

本文详细介绍了Spring Security的基础配置方法，包括如何搭建Maven多模块工程以及具体的安全配置步骤，帮助开发者更好地理解和应用这一强大的安全框架。 ... [详细]

蜡笔小新 2024-11-22 20:52:07
java
从迷茫到收获：阿里腾讯实习Offer的求取之路

本文回顾了作者在求职阿里和腾讯实习生过程中，从最初的迷茫到最后成功获得Offer的心路历程。文中不仅分享了个人的面试经历，还提供了宝贵的面试准备建议和技巧。 ... [详细]

蜡笔小新 2024-11-22 19:32:32
java
解析 .NET 中的 AJAX 技术

Asynchronous JavaScript and XML (AJAX) 的流行很大程度上得益于 Google 在其产品如 Google Suggest 和 Google Maps 中的应用。本文将深入探讨 AJAX 在 .NET 环境下的工作原理及其实现方法。 ... [详细]

蜡笔小新 2024-11-22 18:18:57
io
吴石访谈：腾讯安全科恩实验室如何引领物联网安全研究

腾讯安全科恩实验室曾两次成功破解特斯拉自动驾驶系统，并远程控制汽车，展示了其在汽车安全领域的强大实力。近日，该实验室负责人吴石接受了InfoQ的专访，详细介绍了团队未来的重点方向——物联网安全。 ... [详细]

蜡笔小新 2024-11-22 13:27:32
java
使用RxJS在AngularJS中区分单击与拖动操作

本文探讨了如何利用RxJS库在AngularJS应用中实现对用户单击和拖动操作的精确区分，特别是在调整区域大小的场景下。 ... [详细]

蜡笔小新 2024-11-22 11:56:41
java
Android 中的布局方式之线性布局

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2024-11-22 11:20:34
java
敏捷软件开发的核心原则与实践解读

本文是对《敏捷软件开发：原则、模式与实践》一书的深度解析，书中不仅探讨了敏捷方法的核心理念及其应用，还详细介绍了面向对象设计的原则、设计模式的应用技巧及UML的有效使用。 ... [详细]

蜡笔小新 2024-11-21 20:44:12
java
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
java
软件测试行业深度解析：迈向高薪的必经之路

本文深入探讨了软件测试行业的发展现状及未来趋势，旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]

蜡笔小新 2024-11-21 17:32:44
io
机器学习（ML）三之多层感知机

深度学习主要关注多层模型，现在以多层感知机（multilayerperceptron，MLP）为例，介绍多层神经网络的概念。隐藏层多层感知机在单层神经网络的基础上引入了一到多个隐藏 ... [详细]

蜡笔小新 2024-11-19 19:02:28
io
【转】强大的矩阵奇异值分解(SVD)及其应用

在工程实践中，经常要对大矩阵进行计算，除了使用分布式处理方法以外，就是通过理论方法，对矩阵降维。一下文章，我在 ... [详细]

蜡笔小新 2024-11-16 12:44:31
java
如何在没有提交按钮的情况下提交HTML表单？

探讨了在HTML表单中使用元素代替进行表单提交的方法。 ... [详细]

蜡笔小新 2024-11-22 17:48:42